# D e n n i s   M o s k o v ,   M a s t e r   T h e s i s 
 
 # S p l i t   b y   u n i q u e   a r t i c l e s   
 
 #   M L R   f o r   m o d e l   f i t n e s s 
 
 # c o n v e r s i o n ,   s e l e c t i v i t y   a n d   y i e l d 
 
 
 
 # r a n d o m l y   s h u f f l e   t h e   d a t a 
 
 s e t . s e e d ( 7 7 )                                             #   s e e d   f o r   r e p r o d u c i b i l i t y 
 
 D B s < - D B [ s a m p l e ( n r o w ( D B ) ) , ] 
 
 
 
 # i n i t i a t e   p o s s i b l e   r e s u l t s 
 
 r e s u l t s < - r b i n d ( c ( " C o n v e r s i o n " , " S e l e c t i v i t y " , " Y i e l d " ) , c ( " X . M e O H " , " S . M e O H " , " Y . M e O H " ) , c ( l e n g t h ( D B s ) - 2 , l e n g t h ( D B s ) - 1 , l e n g t h ( D B s ) ) ) 
 
 
 
 # l o o p   t h r o u g h   d i f f e r e n t   o u t c o m e s 
 
 f o r   ( r   i n   1 : 3 )   { 
 
 
 
 # u s e   d e s i r e d   o u t c o m e 
 
 u s e D B < - D B s [ - c ( 1 , a s . n u m e r i c ( r e s u l t s [ 3 , - r ] ) ) ] 
 
 
 
 # i n i t i a t e   r e s u l t s   l i s t s 
 
 r e s < - l i s t ( ) 
 
 r e s . n a m e s < - c ( " n u m b e r " , " f i t t e d " , " o b s e r v e d " , " r e s i d u a l s " , " r e s i d u a l s _ s q u a r e d " ) 
 
 A n o v a < - l i s t ( ) 
 
 s u m m < - l i s t ( ) 
 
 
 
 # i n i t i a t e   m a t r i c e s   f o r   r e g r e s s i o n   a n d   p r e d i c t i o n   v a l u e s 
 
 r e g < - m a t r i x ( ,   n r o w   =   1 0 , n c o l   =   1 ) 
 
 c o l n a m e s ( r e g ,   d o . N U L L   =   F A L S E ) 
 
 c o l n a m e s ( r e g )   < -     " o v e r a l l " 
 
 r o w n a m e s ( r e g )   < -   c ( " S a m p l e " , " R S S " , " T S S " , " M S S " , " R  " , " R " , " a d j . R  " , " M S E " , " R M S E " , " S D E C " ) 
 
 p r e d i c < - m a t r i x ( , n r o w = 4 , n c o l = 1 ) 
 
 c o l n a m e s ( p r e d i c )   < -     " o v e r a l l " 
 
 r o w n a m e s ( p r e d i c )   < -   c ( " P R E S S " , " Q  " , " P S E " , " S D E P " ) 
 
 
 
 # i n i t i a t e   m a t r i x   f o r   p - v a l u e s   f o r   i m p o r t a n c e   a n a l y s i s 
 
 p v a l < - v e c t o r ( " l i s t " ,   1 ) 
 
 p v a l n < - v e c t o r ( " l i s t " ,   1 ) 
 
 
 
 
 
         
 
       	 # m u l t i p l e   l i n e a r   r e g r e s s i o n   a n d   p r e d i c t i o n     
 
 	 f o r m   < -   p a s t e ( n a m e s ( u s e D B ) [ l e n g t h ( u s e D B ) ] ,   " ~ " ,   p a s t e ( n a m e s ( u s e D B ) [ - l e n g t h ( u s e D B ) ] ,   c o l l a p s e = "   +   " ) ) 
 
     	 f i t < - l m ( f o r m ,   d a t a = u s e D B ) 
 
 
 
 	 # p r e d i c t 
 
                 p r e d < - p r e d i c t ( o b j e c t = f i t ,   n e w d a t a = u s e D B ) 
 
 
 
         # s a v e   r e s u l t s 
 
         r e s $ n u m b e r < - a s . n u m e r i c ( n a m e s ( p r e d ) ) 
 
         r e s $ f i t t e d < - u n n a m e ( p r e d ) 
 
         r e s $ o b s e r v e d < - u s e D B [ , l e n g t h ( u s e D B ) ] 
 
         r e s $ r e s i d u a l s < - r e s $ o b s e r v e d - r e s $ f i t t e d 
 
         r e s $ r e s i d u a l s _ s q u a r e d < - ( r e s $ r e s i d u a l s ) ^ 2 
 
 
 
         # v a l u e s   f o r   m o d e l   f i t n e s s 
 
         r e g [ " S a m p l e " , 1 ] < - n r o w ( u s e D B )                                   # n u m b e r   o f   d a t a p o i n t s   i n   t r a i n i n g   s e t   o f   t h e   f o l d 
 
         r e g [ " R S S " , 1 ] < - s u m ( r e s $ r e s i d u a l s _ s q u a r e d )     # R e s i d u a l   S u m   o f   S q u a r e s 
 
         r e g [ " T S S " , 1 ] < - s u m ( ( r e s $ o b s e r v e d - m e a n ( r e s $ o b s e r v e d ) ) ^ 2 )                                             # T o t a l   S u m   o f   S q u a r e s 
 
         r e g [ " M S S " , 1 ] < - r e g [ " T S S " , 1 ] - r e g [ " R S S " , 1 ]                                   # M o d e l   S u m   o f   S q u a r e s 
 
         r e g [ " R  " , 1 ] < - r e g [ " M S S " , 1 ] / r e g [ " T S S " , 1 ]                                                           # c o e f f i c i e n t   o f   d e t e r m i n a t i o n 
 
         r e g [ " R " , 1 ] < - s q r t ( r e g [ " R  " , 1 ] )                                                       # m u l t i p l e   c o r r e l a t i o n   c o e f f i c i e n t 
 
         r e g [ " a d j . R  " , 1 ] < -   1 - ( ( 1 - r e g [ " R  " , 1 ] ) * ( ( r e g [ " S a m p l e " , 1 ] - 1 ) / ( r e g [ " S a m p l e " , 1 ] - f i t $ r a n k ) ) )             
 
 	                                                   # A d j u s t e d   c o e f f i c i e n t   o f   d e t e r m i n a t i o n 
 
         r e g [ " M S E " , 1 ] < - r e g [ " R S S " , 1 ] / ( r e g [ " S a m p l e " , 1 ] - ( f i t $ r a n k + 1 ) )     # M e a n   s q u a r e   e r r o r 
 
         r e g [ " R M S E " , 1 ] < - s q r t ( r e g [ " M S E " , 1 ] )                                                     # R o o t   M e a n   s q u a r e   e r r o r   ( r e s i d u a l   s t a n d a r d   d e v i a t i o n )                                             
 
         r e g [ " S D E C " , 1 ] < - s q r t ( r e g [ " R S S " , 1 ] / r e g [ " S a m p l e " , 1 ] )               # S t a n d a r d   D e v i a t i o n   E r r o r   i n   C a l c u l a t i o n 
 
 
 
         
 
 
 
         # s a v e   a n o v a   a n d   s u m m a r y   r e s u l t s   f o r   v a l u e   e x t r a c t i o n   a n d   s i g n i f i c a n c e   a n a l y s i s 
 
         A n o v a < - a n o v a ( f i t ) 
 
         s u m m < - s u m m a r y ( f i t ) 
 
         p v a l n < - r o w n a m e s ( A n o v a [ 5 ] ) 
 
         p v a l < - A n o v a [ 5 ] [ , 1 ] 
 
         
 
         p v a l < - c b i n d ( p v a l n , p v a l ) 
 
 
 
 # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - P L O T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 
 
 # p l o t   p r e d i c t e d   v s .   o b s e r v e d 
 
 x 1 1 ( ) 
 
 p l o t ( r e s $ f i t t e d , r e s $ o b s e r v e d , p c h = 1 6 ,   c o l = " b l u e " , x l i m = c ( 0 , 1 ) , y l i m = c ( 0 , 1 ) , x a x s = " i " , y a x s = " i " , x l a b = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] ) ,   y l a b = p a s t e ( " O b s e r v e d   M e O H " , r e s u l t s [ 1 , r ]   ) , m a i n = p a s t e ( " F i t t e d   v s .   O b s e r v e d   M e O H " , r e s u l t s [ 1 , r ] ) ) 
 
 a b l i n e ( 0 , 1 ) 
 
 
 
 x 1 1 ( ) 
 
 p l o t ( r e s $ f i t t e d , r e s $ o b s e r v e d , p c h = 1 6 ,   c o l = " b l u e " , x l i m = c ( m i n ( 0 , m i n ( r e s $ f i t t e d ) ) , m a x ( m a x ( r e s $ o b s e r v e d ) , m a x ( r e s $ f i t t e d ) ) ) , y l i m = c ( m i n ( 0 , m i n ( r e s $ f i t t e d ) ) , m a x ( m a x ( r e s $ o b s e r v e d ) , m a x ( r e s $ f i t t e d ) ) ) , x a x s = " i " , y a x s = " i " , x l a b = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] ) ,   y l a b = p a s t e ( " O b s e r v e d   M e O H " , r e s u l t s [ 1 , r ]   ) , m a i n = p a s t e ( " F i t t e d   v s .   O b s e r v e d   M e O H " , r e s u l t s [ 1 , r ] ) ) 
 
 a b l i n e ( 0 , 1 ) 
 
 
 
 
 
 # p l o t   p r e d i c t e d   v s .   r e s i d u a l s 
 
 x 1 1 ( )   
 
 p l o t ( r e s $ f i t t e d , r e s $ r e s i d u a l s ,   c o l = " b l u e " , x l i m = c ( 0 , 1 ) ,   y l i m = c ( - 1 , 1 ) , x a x s = " i " , y a x s = " i " , x l a b = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] ) ,   y l a b = " R e s i d u a l s " , m a i n = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] , " v s .   R e s i d u a l s " ) , p c h = 1 6 ) 
 
 a b l i n e ( h = 0 ) 
 
 
 
 x 1 1 ( )   
 
 p l o t ( r e s $ f i t t e d , r e s $ r e s i d u a l s ,   c o l = " b l u e " , x l i m = c ( m i n ( r e s $ f i t t e d ) , m a x ( r e s $ f i t t e d ) ) ,   y l i m = c ( m i n ( r e s $ r e s i d u a l s ) , m a x ( r e s $ r e s i d u a l s ) ) , x a x s = " i " , y a x s = " i " , x l a b = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] ) ,   y l a b = " R e s i d u a l s " , m a i n = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] , " v s .   R e s i d u a l s " ) , p c h = 1 6 ) 
 
 a b l i n e ( h = 0 ) 
 
 
 
 
 
 
 
 # p l o t   r e s i d u a l   d e n s i t y 
 
 x 1 1 ( ) 
 
 p l o t ( d e n s i t y ( r e s $ r e s i d u a l s ) , x l a b = " R e s i d u a l s " ,   y l a b = " D e n s i t y " , m a i n = p a s t e ( " D e n s i t y   P l o t   o f   R e s i d u a l s   f o r " , r e s u l t s [ 1 , r ] ) ) 
 
 
 
 # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D I S P L A Y - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 
 
 
 
 # d i s p l a y   i n s i g n i f i c a n t   v a r i a b l e s   p v a l u e   > 0 . 0 5 
 
 # p v a l [ ( p v a l [ , " o v e r a l l " ] > 0 . 0 5 ) , " o v e r a l l " ] 
 
 V i e w ( r e g , p a s t e ( " R e g r e s s i o n   V a l u e s   f o r   M e O H " , r e s u l t s [ 1 , r ] ) ) 
 
 # V i e w ( p r e d i c , p a s t e ( " P r e d i c t i o n   V a l u e s   f o r   M e O H " , r e s u l t s [ 1 , r ] ) ) 
 
 # V i e w ( p v a l , p a s t e ( " p - v a l u e s   f o r   i m p o r t a n c e   a n a l y s i s   f o r   M e O H " , r e s u l t s [ 1 , r ] ) ) 
 
 
 
 # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - S A V E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 
 
 # p l o t   p r e d i c t e d   v s .   o b s e r v e d 
 
 p n g ( f i l e n a m e = p a s t e ( r e s u l t s [ 1 , r ] , "   f i t t e d V S o b s   f u l l . p n g " ) ) 
 
 p a r ( n e w = T R U E ,   p c h = 1 6 ) 
 
 p l o t ( r e s $ f i t t e d , r e s $ o b s e r v e d , p c h = 1 6 ,   c o l = " b l u e " , x l i m = c ( 0 , 1 ) , y l i m = c ( 0 , 1 ) , x a x s = " i " , y a x s = " i " , x l a b = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] ) ,   y l a b = p a s t e ( " O b s e r v e d   M e O H " , r e s u l t s [ 1 , r ]   ) , m a i n = p a s t e ( " F i t t e d   v s .   O b s e r v e d   M e O H " , r e s u l t s [ 1 , r ] ) ) 
 
 a b l i n e ( 0 , 1 ) 
 
 d e v . o f f ( ) 
 
 
 
 p n g ( f i l e n a m e = p a s t e ( r e s u l t s [ 1 , r ] , "   f i t t e d V S o b s   c r o p e d . p n g " ) ) 
 
 p a r ( n e w = T R U E ,   p c h = 1 6 ) 
 
 p l o t ( r e s $ f i t t e d , r e s $ o b s e r v e d , p c h = 1 6 ,   c o l = " b l u e " , x l i m = c ( m i n ( 0 , m i n ( r e s $ f i t t e d ) ) , m a x ( m a x ( r e s $ o b s e r v e d ) , m a x ( r e s $ f i t t e d ) ) ) , y l i m = c ( m i n ( 0 , m i n ( r e s $ f i t t e d ) ) , m a x ( m a x ( r e s $ o b s e r v e d ) , m a x ( r e s $ f i t t e d ) ) ) , x a x s = " i " , y a x s = " i " , x l a b = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] ) ,   y l a b = p a s t e ( " O b s e r v e d   M e O H " , r e s u l t s [ 1 , r ]   ) , m a i n = p a s t e ( " F i t t e d   v s .   O b s e r v e d   M e O H " , r e s u l t s [ 1 , r ] ) ) 
 
 a b l i n e ( 0 , 1 ) 
 
 d e v . o f f ( ) 
 
 
 
 # p l o t   p r e d i c t e d   v s .   r e s i d u a l s 
 
 p n g ( f i l e n a m e = p a s t e ( r e s u l t s [ 1 , r ] , "   f i t t e d V S r e s   f u l l . p n g " ) ) 
 
 p l o t ( r e s $ f i t t e d , r e s $ r e s i d u a l s ,   c o l = " b l u e " , x l i m = c ( 0 , 1 ) , y l i m = c ( - 1 , 1 ) , x a x s = " i " , y a x s = " i " , x l a b = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] ) ,   y l a b = " R e s i d u a l s " , m a i n = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] , " v s .   R e s i d u a l s " ) , p c h = 1 6 ) 
 
 a b l i n e ( h = 0 ) 
 
 d e v . o f f ( ) 
 
 
 
 p n g ( f i l e n a m e = p a s t e ( r e s u l t s [ 1 , r ] , "   f i t t e d V S r e s   c r o p e d . p n g " ) ) 
 
 p l o t ( r e s $ f i t t e d , r e s $ r e s i d u a l s ,   c o l = " b l u e " , x l i m = c ( m i n ( r e s $ f i t t e d ) , m a x ( r e s $ f i t t e d ) ) ,   y l i m = c ( m i n ( r e s $ r e s i d u a l s ) , m a x ( r e s $ r e s i d u a l s ) ) , x a x s = " i " , y a x s = " i " , x l a b = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] ) ,   y l a b = " R e s i d u a l s " , m a i n = p a s t e ( " F i t t e d   M e O H " , r e s u l t s [ 1 , r ] , " v s .   R e s i d u a l s " ) , p c h = 1 6 ) 
 
 a b l i n e ( h = 0 ) 
 
 d e v . o f f ( ) 
 
 
 
 
 
 # p l o t   r e s i d u a l   d e n s i t y 
 
 p n g ( f i l e n a m e = p a s t e ( r e s u l t s [ 1 , r ] , "   r e s D e n s i t y . p n g " ) ) 
 
 p l o t ( d e n s i t y ( r e s $ r e s i d u a l s ) , x l a b = " R e s i d u a l s " ,   y l a b = " D e n s i t y " , m a i n = p a s t e ( " D e n s i t y   P l o t   o f   R e s i d u a l s   f o r " , r e s u l t s [ 1 , r ] ) ) 
 
 d e v . o f f ( ) 
 
 
 
 # r e g r e s s i o n   a n d   p r e d i c t i o n   r e s u l t s 
 
 w r i t e . c s v ( r e g ,   f i l e   = p a s t e ( r e s u l t s [ 1 , r ] , "   r e g r e s s i o n _ v a l u e s . c s v " ) ) 
 
 w r i t e . c s v ( p r e d i c ,   f i l e   = p a s t e ( r e s u l t s [ 1 , r ] , "   p r e d i c t i o n _ v a l u e s . c s v " ) ) 
 
 w r i t e . c s v ( r e s ,   f i l e   = p a s t e ( r e s u l t s [ 1 , r ] , "   r e s u l t s . c s v " ) ,   r o w . n a m e s = F A L S E ) 
 
 c a p t u r e . o u t p u t ( s u m m ,   f i l e   = p a s t e ( r e s u l t s [ 1 , r ] ,   "   S u m m a r y . t x t " ) ) 
 
 c a p t u r e . o u t p u t ( A n o v a ,   f i l e   = p a s t e ( r e s u l t s [ 1 , r ] ,   "   A n o v a . t x t " ) ) 
 
 w r i t e . c s v ( p v a l ,   f i l e   = p a s t e ( r e s u l t s [ 1 , r ] , "   p - v a l u e s . c s v " ) ) 
 
 
 
 } 
 
 
 
 
 
 